期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 联合分层注意力网络和独立循环神经网络的地域欺凌识别
孟曌, 田生伟, 禹龙, 王瑞锦
计算机应用    2019, 39 (8): 2450-2455.   DOI: 10.11772/j.issn.1001-9081.2019010033
摘要510)      PDF (983KB)(280)    收藏
为提高对文本语境深层次信息的利用效率,提出了联合分层注意力网络(HAN)和独立循环神经网络(IndRNN)的地域欺凌文本识别模型——HACBI。首先,将手工标注的地域欺凌文本通过词嵌入技术映射到低维向量空间中;其次,借助卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)提取地域欺凌文本的局部及全局语义特征,并进一步利用HAN捕获文本的内部结构信息;最后,为避免文本层次结构信息丢失和解决梯度消失等问题,引入IndRNN以增强模型的描述能力,并实现信息流的整合。实验结果表明,该模型的准确率(Acc)、精确率(P)、召回率(R)、F1和AUC值分别为99.57%、98.54%、99.02%、98.78%和99.35%,相比支持向量机(SVM)、CNN等文本分类模型有显著提升。
参考文献 | 相关文章 | 多维度评价
2. 基于纹理指纹与活动向量空间的Android恶意代码检测
罗世奇, 田生伟, 禹龙, 于炯, 孙华
计算机应用    2018, 38 (4): 1058-1063.   DOI: 10.11772/j.issn.1001-9081.2017102499
摘要467)      PDF (862KB)(401)    收藏
为了进一步提高恶意代码识别的准确率和自动化程度,提出一种基于深度学习的Android恶意代码分析与检测方法。首先,提出恶意代码纹理指纹体现恶意代码二进制文件块内容相似性,选取33类恶意代码活动向量空间来反映恶意代码的潜在动态活动。其次,为确保分类准确率的提高,融合上述特征,训练自编码器(AE)和Softmax分类器。通过对不同数据样本进行测试,利用栈式自编码(SAE)模型对Android恶意代码的分类平均准确率可达94.9%,比支持向量机(SVM)高出1.1个百分点。实验结果表明,所提出的方法能够有效提高恶意代码识别精度。
参考文献 | 相关文章 | 多维度评价
3. 基于栈式自编码的水体提取方法
王知音, 禹龙, 田生伟, 钱育蓉, 丁建丽, 杨柳
计算机应用    2015, 35 (9): 2706-2709.   DOI: 10.11772/j.issn.1001-9081.2015.09.2706
摘要501)      PDF (619KB)(13070)    收藏
为了进一步提高利用遥感图像进行水体提取的准确率和自动化程度,提出一种基于栈式自编码(SAE)深度神经网络的水体提取方法。通过堆叠稀疏自编码器构建深度网络模型,使用逐层贪婪训练法依次训练每层网络,从像素层面无监督学习特征,避免传统神经网络等方法需进行人工特征分析与选取的问题;用学习到的特征结合相应的样本标签有监督训练softmax分类器;利用反向传播(BP)算法微调优化整个模型。采用塔里木河ETM+数据进行实验,基于SAE的水体提取方法准确率达到94.73%,比支持向量机(SVM)和反向传播(BP)神经网络方法分别高出3.28%和4.04%。实验结果表明,所提方法能有效提高水体提取的精度。
参考文献 | 相关文章 | 多维度评价
4. 基于一致性Hash的分布式海量分子检索模型
孙霞, 禹龙, 田生伟, 闫奕霖, 林江丽
计算机应用    2015, 35 (4): 956-959.   DOI: 10.11772/j.issn.1001-9081.2015.04.0956
摘要536)      PDF (581KB)(530)    收藏

针对大数据环境下,传统通用图匹配检索低效、折射率数据无法快速定位的问题,建立了基于一致性Hash的分布式海量分子检索模型。模型结合分子特点,将连续的折射率通过等宽算法离散化建立高速Hash索引,实现分布式海量分子检索系统,有效减小了参与计算的分子数据规模,并根据分子访问频次处理冲突从而提高分子检索效率。实验结果表明,在包含20万个分子的数据中,该方法平均检索耗时约为通用图匹配平均检索耗时的5%,模型性能稳定,具有高可扩展性;对于海量数据环境下依据折射率检索高频次分子较为适用。

参考文献 | 相关文章 | 多维度评价
5. 云计算环境下对资源聚类的工作流任务调度算法
郭凤羽 禹龙 田生伟 于炯 孙华
计算机应用    2013, 33 (08): 2154-2157.  
摘要856)      PDF (614KB)(543)    收藏
针对云计算环境中资源具有规模庞大、异构性、多样性等特点,提出了一种对资源进行模糊聚类的工作流任务调度算法。经过对网络资源属性进行量化、规范化,以预先构建的任务模型和资源模型为基础,结合模糊数学理论划分资源,使得在任务调度时能够较准确地优先选择综合性能较好的资源类簇,缩短了任务资源相匹配的时间,提高了调度性能。通过仿真实验将此算法与HEFT、DLS进行比较,实验结果表明,当任务在[0,100]范围增加时,该算法平均SLR比HEFT小34%,比DLS小99%,其平均Speedup比HEFT大59%,比DLS大102%;当资源在[0,100]范围增加时,该算法平均SLR比HEFT小36%,比DLS小97%,其平均Speedup比HEFT大45%,比DLS大108%。所提算法实现了对资源的合理划分,且在执行跨度方面具有优越性。
参考文献 | 相关文章 | 多维度评价
6. 面向维吾尔语文本的改进后缀树聚类
翟献民 田生伟 禹龙 冯冠军
计算机应用    2012, 32 (04): 1078-1081.   DOI: 10.3724/SP.J.1087.2012.01078
摘要1210)      PDF (600KB)(402)    收藏
针对后缀树聚类选取基类时,基类短语出现信息不规范、重复和冗余的问题,提出了一种改进后缀树聚类算法。该算法首先以短语互信息算法改进基类的选取,选出遵守维吾尔语语法规则的基类短语;然后,利用短语归并算法对选取的重复基类短语进行归并;最后,在前两步的工作基础上,利用短语去冗余算法处理冗余的基类短语。实验证明,与传统后缀树聚类(STC)相比,改进后缀树聚算法的全面率、准确率都得到了提高。这表明,改进算法有效地改善了聚类效果。
参考文献 | 相关文章 | 多维度评价
7. Web文本中维吾尔语领域术语的自动发现
钟军 田生伟 禹龙
计算机应用    2012, 32 (02): 407-410.   DOI: 10.3724/SP.J.1087.2012.00407
摘要975)      PDF (599KB)(363)    收藏
针对维吾尔语领域术语获取难度大,人工扩充领域术语工作量大、效率低等特点,利用词汇共现原理,以维吾尔语连接词和互信息(MI)为工具,快速扩充原始维吾尔语领域术语;建立了以维吾尔语领域术语为特征模板,利用条件随机场(CRF)模型实现Web文本中维吾尔语领域术语的自动发现方法,并在此基础上实现长维吾尔语领域术语的自动发现。实验表明,对短维吾尔语领域术语的自动发现准确率为 97.59%,召回率为 93.38%,对长维吾尔语领域术语的自动发现正确率达到55.72%。
参考文献 | 相关文章 | 多维度评价